@深巷
2年前 提问
1个回答
大数据的5v特征分别是什么
一颗小胡椒
2年前
大数据的5v特征如下:
容量(Volume):容量是指大规模的数据量,并且数据量呈持续增长趋势。目前一般指超过10TB规模的数据量,但未来随着技术的进步,符合大数据标准的数据集大小也会变化。大规模的数据对象构成的集合,即称为“数据集”。不同的数据集具有维度不同、稀疏性不同(有时一个数据记录的大部分特征属性都为0),以及分辨率不同(分辨率过高,数据模式可能会淹没在噪声中;分辨率过低,模式无从显现)的特性。
速率(Velocity):速率即数据生成、流动速率快。数据流动速率指对数据采集、存储以及分析具有价值信息的速度。大数据往往以数据流的形式动态、快速地产生,具有很强的时效性,用户只有把握好对数据流的掌控才能有效利用这些数据。数据自身的状态与价值也往往随时空变化而发生演变,因此也意味着数据的采集和分析等过程必须迅速及时。
多样性(Variety):多样性是指大数据包括多种不同格式和不同类型的数据。数据来源包括人与系统交互时与机器自动生成,来源的多样性导致数据类型的多样性。根据数据是否具有一定的模式、结构和关系,数据可分为三种基本类型:结构化数据、非结构化数据和半结构化数据。
真实性(Veracity):真实性是指数据的质量和保真性。大数据环境下的数据最好具有较高的信噪比。信噪比与数据源和数据类型无关。
价值(Value):价值即低价值密度。随着数据量的增长,数据中有意义的信息却没有成相应比例增长。而价值同时与数据的真实性和数据处理时间相关。